TLDR: Compresión de Tokens de Audio para TTS Autoregresivo Eficiente
Descubre TLDR, la técnica que acelera hasta 1.8x el TTS autoregresivo reduciendo la memoria KV cache en 75% mediante parches de tokens. ¡Optimiza tus modelos!
Descubre TLDR, la técnica que acelera hasta 1.8x el TTS autoregresivo reduciendo la memoria KV cache en 75% mediante parches de tokens. ¡Optimiza tus modelos!
Aprende cómo LM-SPT logra una tokenización de voz más alineada con modelos de lenguaje, mejorando ASR y TTS sin sacrificar calidad.